"""
Author : Mr.Sun
Datetime : 2024/3/7 16:59 
FileName : textblob_category.py
Desc : 
"""
from textblob.classifiers import NaiveBayesClassifier
import pickle

# 准备训练数据
train_data = [
    ("2023年湖南湘西州龙山县卫生健康局选调10人公告", "省市招聘"),
    ("2023年江苏省宜兴市教育系统面向全国引进紧缺型优秀人才6人公告", "省市招聘"),
    ("2023年江苏无锡市梁溪区教育系统招聘成熟型幼儿教师5人公告", "省市招聘"),
    ("2023年吉林电子信息职业技术学院招聘9人公告(4号)", '省市招聘'),
    ("2023年安徽交通职业技术学院高层次及紧缺人才招聘3人公告", '大学招聘'),
    ("湖南中南大学湘雅医学院非事业编制工作人员招聘公告", '省市招聘'),
    ("湖南中南大学资源循环研究院非事业编人员招聘公告", '省市招聘'),
    ("安徽阜阳会龙镇招考第九批村级后备干部公告", '省市招聘'),
    ("北京市信访办公室综合事务中心招聘公告", '省市招聘'),
    ("2023上半年四川乐山市沙湾区招聘高层次人才4人公告", '省市招聘'),
    ("2023年江苏南京师范大学附属中学招聘教师32人公告", '省市招聘'),
    ("2023年黑龙江双鸭山市友谊县招聘教师22人公告", '省市招聘'),
    ("安徽省公共卫生临床中心安徽医科大学第一附属医院北区高层次人才招聘公告", '省市招聘'),
    ("安徽六安市金安区消防救援大队外聘财务人员公告", '省市招聘'),
    ("2024年江西东华理工大学硕士及以下人员招聘41人公告", '大学招聘'),
    ("2024年山东警察学院招聘工作人员40人简章", '大学招聘'),
    ("广西北海职业学院招聘高层次急需紧缺人才37人公告", '大学招聘'),
    ("2024年国家粮食和物资储备局安徽局所属事业单位招聘16人公告", '省市招聘'),
    ("2024年中央民族大学高层次人才引进25人公告", '大学招聘'),
    ("2024年安徽阜阳市直事业单位招聘43人公告", '省市招聘'),
    ("2024年北京市农林科学院杰出科研人才引进公告", '大学招聘'),
    ("2024年天津理工大学硕士辅导员和心理教师岗招聘14人方案", '大学招聘'),
    ("2024年山西太原师范学院招聘20人公告", '大学招聘'),
    ("2024年天津体育学院招聘硕士辅导员岗位工作人员5人方案", '大学招聘'),
    ("2024年天津师范大学博士层次专业技术岗位招聘方案", '大学招聘'),
]

# 构建分类器
classifier = NaiveBayesClassifier(train_data)

# 保存分类器到文件
with open('text_classifier.pkl', 'wb') as f:
    pickle.dump(classifier, f)

# 加载分类器
with open('text_classifier.pkl', 'rb') as f:
    loaded_classifier = pickle.load(f)

# 测试数据
test_data = [
    "2024年山西农业大学招聘28人公告",
]

# 使用加载的分类器进行预测
for text in test_data:
    category = loaded_classifier.classify(text)
    print(f"文本: {text}，预测分类: {category}")
